library(tidyverse)
library(plotly)
library(GGally)Exemplo disponível em: Paula, G. A. (2013). Modelos de Regressão com Apoio Computacional. São Paulo, SP: IME-USP. (Exercício 23, página 112). Dados disponíveis em: https://www.ime.usp.br/~giapaula/textoregressao.htm
Neste trabalho, vamos modelar o preço de venda de imóveis a partir de dados relativos a uma amostra de 27 imóveis. As variáveis desse conjunto de dados são:
imposto: imposto do imóvel (em US$ 100);
areaT: área do terreno (em 1.000 pés quadrados);
areaC: área construída (em 1.000 pés quadrados);
idade: idade da residência (em anos);
preco: preço de venda do imóvel (em US$ 1.000).
Sendo assim, o objetivo dessa modelo é explicar a variável preço de venda a partir das variáveis área do terreno, área construída e idade.
dados = read.table("imoveis.dat")
colnames(dados) = c("imposto", "areaT", "areaC", "idade", "preco")
attach(dados)
dados## imposto areaT areaC idade preco
## 1 4.9176 3.4720 0.998 42 25.9
## 2 5.0208 3.5310 1.500 62 29.5
## 3 4.5429 2.2750 1.175 40 27.9
## 4 4.5573 4.0500 1.232 54 25.9
## 5 5.0597 4.4550 1.121 42 29.9
## 6 3.8910 4.4550 0.988 56 29.9
## 7 5.8980 5.8500 1.240 51 30.9
## 8 5.6039 9.5200 1.501 32 28.9
## 9 15.4202 9.8000 3.420 42 84.9
## 10 14.4598 12.8000 3.000 14 82.9
## 11 5.8282 6.4350 1.225 32 35.9
## 12 5.3003 4.9883 1.552 30 31.5
## 13 6.2712 5.5200 0.975 30 31.0
## 14 5.9592 6.6660 1.121 32 30.9
## 15 5.0500 5.0000 1.020 46 30.0
## 16 8.2464 5.1500 1.664 50 36.9
## 17 6.6969 6.9020 1.488 22 41.9
## 18 7.7841 7.1020 1.376 17 40.5
## 19 9.0384 7.8000 1.500 23 43.9
## 20 5.9894 5.5200 1.256 40 37.5
## 21 7.5422 4.0000 1.690 22 37.9
## 22 8.7951 9.8900 1.820 50 44.5
## 23 6.0931 6.7265 1.652 44 37.9
## 24 8.3607 9.1500 1.777 48 38.9
## 25 8.1400 8.0000 1.504 3 36.9
## 26 9.1416 7.3262 1.831 31 45.8
## 27 12.0000 5.0000 1.200 30 41.0
O gráfico interativo abaixo nos mostra as medidas resumo para cada uma das variáveis.
plot_ly(type = "box") %>%
add_boxplot(y = imposto, name = "imposto") %>%
add_boxplot(y = areaT, name = "área do terreno") %>%
add_boxplot(y = areaC, name = "área construída") %>%
add_boxplot(y = idade, name = "idade do imóvel") %>%
add_boxplot(y = preco, name = "preço de venda")ggpairs(dados,aes(color=I("wheat4"),fill=I("wheat2")),alpha=0.5)ggcorr(dados,low = "red", high= "blue")